Nouveaux services basés sur des agrégations de mots-clés validées sémantiquement

نویسندگان

  • Christian Belbèze
  • Max Chevalier
  • Chantal Soulé-Dupuy
چکیده

RÉSUMÉ. A l’heure du Web social, nous présentons une solution pouvant servir de base à de nouveaux services tels que la construction automatique et dynamique de communautés d‘utilisateurs. Pour cela, nous proposons de créer des agrégats de mots clés issus des recherches antérieures des utilisateurs pour construire ces communautés. Nous présentons la démarche que nous avons suivie pour obtenir un algorithme de regroupement des mots-clés provenant de fichiers de traçage (log) ; nous illustrons cet algorithme au travers de son application au fichier de traçage du moteur de recherche aol.com. Afin d’évaluer les résultats obtenus, nous proposons une démarche permettant, par comparaison, l’obtention d’un coefficient de cohérence sémantique des agrégats ainsi créés. Dans une expérimentation nous mesurerons la perte de cohérence sémantique liée à l’augmentation de la taille des agrégats. L’intérêt de l’approche proposée réside dans le fait qu’elle peut être exploitée pour offrir encore plus de services à l’usager. ABSTRACT. At the time of social Web, we present a solution able to build new services offered to users such as the automatic and dynamic construction of users’ communities. These communities are done by the creation of semantically coherent aggregates, built from keywords from previous users’ queries. We present algorithms for keywords gathering; these keywords are resulting from aol.com search engine log files. To evaluate these results, we developed a methodology allowing, by comparison, to obtain a semantic coherence coefficient on the aggregates thus created. As an experiment we measure the loss of semantic coherence related to the increase of the aggregates size. The main advantage of the proposed approach is that it can be exploited to offer the user more services

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Enrichissement sémantique de documents XML représentant des tableaux

Résumé. Ce travail a pour objectif la construction automatique d’un entrepôt thématique de données, à partir de documents de format divers provenant du Web. L’exploitation de cet entrepôt est assurée par un moteur d’interrogation fondé sur une ontologie. Notre attention porte plus précisément sur les tableaux extraits de ces documents et convertis au format XML, aux tags exclusivement syntaxiqu...

متن کامل

Interrogation à base d'Annotation Sémantique

Résumé. Les approches de la recherche d’information (RI) actuelles ne saisissent pas formellement la signification explicite d'une requête à base de mots-clés mais fournissent une voie confortable pour l'utilisateur qui spécifie ces besoins en informations sur la base des mots-clés. La recherche sémantique promet de fournir des résultats plus précis que la traditionnelle recherche par mots-clés...

متن کامل

Recherche de documents similaires sur le web par segmentations hiérarchiques et extraction de mots-clés

Résumé. La recherche de documents similaires est un processus qui consiste à trouver les documents présentant des similitudes, comme la copie ou la reformulation, sur des bases documentaires ou sur internet. Elle est utilisée notamment pour protéger la propriété intellectuelle de productions issues de l’enseignement, de la recherche ou de l’industrie. Dans cet article, nous définissons une appr...

متن کامل

De l'estimation locale par imagerie q-ball à la tractographie des croisements de fibres

RÉSUMÉ. Le croisement de fibres est un problème important dans la plupart des algorithmes de suivi de fibres basés sur l’imagerie du tenseur de diffusion (DTI). Pour surmonter les limites du DTI, des techniques d’IRM à haute résolution angulaire (HARDI) comme l’imagerie par q-ball (QBI) ont été introduites. Le but de cet article est de présenter un état de l’art des techniques de reconstruction...

متن کامل

Identification Biométrique des Individus par leurs Empreintes Palmaires «Palmprints»: Classification par la Méthode des Séparateurs à Vaste Marge (SVM)

Résumé. L’identification des individus par leurs empreintes palmaires (Palmprints), considérée comme nouveau membre de la famille des modalités biométriques, est devenue un domaine de recherche très actif durant ces dernières années. Les travaux réalisés, jusqu’à présent, se sont basés sur les techniques de représentation des images de palmprints pour une meilleure classification. Dans notre tr...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2009